ReMoE: Impulsando la Reutilización de Expertos mediante el Ajuste Fino del Enrutador en Inferencia de LLM MoE con Restricciones de Memoria
<meta name=description content=ReMoE reutiliza expertos en MoE mediante ajuste fino del enrutador con restricciones de memoria. Optimiza eficiencia y uso de memoria.>